字节清华智能体自动写CUDA内核,比torch.compile加速2.11倍 字节清华智能体自动写CUDA内核,比torch.compile加速2.11倍 关键词: AI新闻,模型训练,CUDA Agent,人工智能 让AI自己写高性能GPU代码,字节Seed与清华AIR团队做到了。 来自主题: AI技术研报 6861 点击 2026-03-04 10:39